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摘要 : [目的 /意义 ] 专 利 引 用 关系 形成 问题 是 理解 创新 网 络 的 一 个 重要 问题 。 传 统 的 回归 模型 对 观察 对 
象 设 定 的 独立 性 假设 ,无 法 将 网 络 的 结构 效应 因素 整合 到 模型 中 来 提供 综合 性 的 统计 推断 。 指 数 随机 图 模型 
(ERGM ,Exponential Random Graph Model) 是 一 种 创新 性 的 统计 推断 方法 , 它 能 够 将 属性 特征 、 自 组 织 特征 以 及 
网 络 协 同 特征 三 种 特征 综合 起 来 观察 。[ 方 法 /过 程 ] 以 奈 拉 滨 药 物 的 专利 引文 网 络 作为 研究 对 象 ,利用 ERGM 
系统 检验 了 影响 专利 引用 关系 的 五 种 机 制 :专利 属性 的 主 效应 ;专利 引用 时 间 的 差 值 效 应 ;专利 引用 关系 的 聚 
锐 训 应 ;专利 引用 关系 的 传递 效应 ;专利 引用 关系 的 网 络 协同 效应 。[ 结果/ 结论] 五 种 机 制 都 在 奈 拉 滨 药 物 的 
A 引用 关系 的 形成 过 程 发 挥 了 作用 。 但 三 种 效应 对 于 奈 拉 滨 药物 的 专利 引用 关系 的 形成 作用 最 为 显著 : 共 
府 发 明 人 关系 协同 效应 、 共 享 家族 关 系 协 同 效 应 、 传 递 效 应 。 一 些 辅 助 机 制 也 会 对 专利 引文 关系 形成 产生 影 


如 引文 时 滞 、 权 利 要 求 数量 和 参考 文献 数量 。 


”关键 词 : 专利 引用 关系 形成 ”指数 随机 图 模型 (ERGM) 
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奈 拉 滨 


统计 网 络 模型 


FREE 
x 专 利 引文 由 于 能 够 思 踪 技术 发 展 的 脉络 ,测量 国 
家 以 域 间 的 技术 扩散 ,技术 溢出 ,衡量 发 明 、 技 术 的 质 
量 本 价值 ,分 析 创新 主体 的 技术 战略 行为 " ,而 在 科 
找 晴 价 过 程 中 具有 十 分 重要 的 作用 。 近 年 来 ,学 者 们 
通过 网 络 分 析 方法 引入 专利 引文 分 析 , 涌 现 大 量 专利 
引文 网 络 相关 的 研究 成 果 , 极 大 丰富 了 专利 引文 分 析 
的 视角 ,突破 了 传统 单纯 依赖 专利 引文 频数 进行 分 析 
的 思路 ,采用 可 视 化 及 描述 性 统计 方法 对 专利 引文 的 
结构 ,动态 特征 开展 了 大 量 的 讨论 。 
然而 ,专利 引用 关系 形成 机 制 问题 研究 是 目前 研 
究 中 较为 薄弱 的 一 环 , 究 其 原因 , 主要 表现 为 两 点 : 
人 观察 视角 上 的 不 足 。 专 利 引文 网 络 的 形成 是 一 个 复 
杂 问题 ,其 影响 因素 可 能 包括 了 专利 引文 网 络 自身 演 


化 过 程 ,专利 自身 属性 特征 以 及 网 络 外 部 因素 等 ;单纯 
地 采用 属性 特征 指标 或 者 网 络 指标 都 难以 很 好 的 解释 
专利 引用 关系 的 形成 机 制 问题 ;另外 ,很 多 在 单一 视 
角 下 成 立 的 研究 结论 之 间 , 在 更 高 层次 进行 观察 时 可 
能 存在 冲突 。@ 统 计 推 断 方法 的 不 足 。 传 统 的 统计 推 
断 方法 ,如 回归 方法 ,是 以 属性 型 数据 为 基础 的 ,以 独 
立 性 假设 为 前 提 的 ,而 网 络 分 析 的 核心 对 象 是 关系 数 
据 , 因 此 ,对 其 设 定 独立 性 假设 是 不 合适 的 ;同时 ,有 
一 些 专门 针对 网 络 数据 的 统计 推断 方法 ,如 二 次 指派 
程序 ( Quadratic Assignment Procedure , QAP) 方 法 虽然 
能 符合 网 络 数 据 的 统计 推断 特点 ,但 其 受到 了 其 框架 
的 约束 ,在 包容 不 同 数据 类 型 扩展 性 方面 存在 不 
足 ”。 正 是 存在 上 面 两 点 不 足 , 需 要 进一步 探索 新 
的 方法 来 回答 专利 引用 关系 形成 的 机 制 问 题 。 

指数 随机 图 模型 (Exponential Random Graph Mod- 
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el, ERGM) 是 一 种 以 关系 形成 (tie formation ) 为 对 象 的 
研究 方法 ” ,ERGM 是 以 关系 数据 为 基础 ,以 依赖 性 假 
设 为 条 件 ,选择 网 络 局 部 结构 作为 网 络 统计 项 来 观察 

复杂 网 络 的 整体 结构 特征 ,从 而 获得 对 于 网 络 复杂 性 
关联 性 以 及 随机 性 的 整体 认 知 的 方法 呈 ,因此 ， 谈 方 法 
能 够 克服 在 专利 引用 关系 形成 机 制 问 题 上 研究 所 面临 
的 上 述 两 种 不 足 ,可 以 使 研究 人 员 获 得 对 专利 引用 关 
系 形成 机 制 的 更 为 全 面 的 理解 。 本 文 的 研究 目标 是 : 
在 关系 形成 理论 的 指引 下 ,以 可 能 对 奈 拉 滨 ( Nelara- 
bine) 药 物 专利 引文 网 络 产 生 影响 的 主要 机 制 为 基础 
建立 多 个 指数 随机 图 模型 ,通过 对 各 种 机 制 对 应 的 网 
络 统计 效应 检验 ,帮助 人 们 理解 究竟 哪些 机 制 对 于 奈 

拉 滨 药物 专利 引文 网 络 的 形成 产生 了 影响 ,影响 效果 
如 何 。 

二 文章 依据 如 下 顺序 进行 组 织 : 第 二 部 分 是 一 个 指 
闯 必 机 图 建 模 的 基本 过 程 ， 简要 描述 影响 专利 引用 关 
系 芽 成 存在 的 五 种 机 制 ,以 及 如 何 转化 为 对 应 的 局 部 
网 颖 配置 ( configuration ) 和 网 络 统计 项 ;第 三 部 分 介绍 
守 验 数据 一 一 奈 拉 滨 药物 的 专利 引文 网 络 , 以 及 利用 
绕 汝 方法 直观 展现 上 述 五 种 机 制 相关 统计 特征 的 发 现 
j 科 ;第 四 部 分 是 模型 分 析 , 包 括 模型 比较 ,诊断 以 及 
氮 傅 优 度 评价 过 程 ;第 五 部 分 则 是 结论 与 讨论 ,进一步 
计 浴 影响 奈 拉 滨 药 物 专利 引文 网 络 形成 的 五 种 核心 机 
制 富 于 专利 引用 关系 形成 的 影响 ,回答 哪些 机 制 对 于 
专 泣 引 用 关系 形成 会 产生 影响 ,哪些 机 制 的 影响 最 为 
王 作 ,以 及 对 于 未 来 药物 研发 的 应 用 价值。 


专利 引用 关系 形成 与 ERGM 


2. 1 影响 专利 引用 关系 形成 的 机 制 
学 者 们 对 于 专利 引用 关系 形成 的 机 制 问 题 已 经 开 
展 了 大 量 的 研究 ,尤其 是 对 于 专利 引文 网 络 结构 特征 ， 
产生 了 大 量 的 研究 成 果 "“"" ,其 中 最 有 代表 性 的 研 
究 是 2017 年 A. B. Jaffe 教授 对 专利 引文 研究 进展 的 
个 梳理 ,她 认为 当前 专利 引文 研究 主要 是 从 三 个 视 
角 出 发 :测量 发 明 的 属性 特征 ,如 影响 与 原创 性 ;追踪 
个 体 、 机 构 、 区 域 之 间 的 知识 流动 ;以 及 描绘 创新 网 络 
图 谱 。 如 果 从 关系 形成 视角 来 理解 上 述 人 研究 , 则 可 以 
将 影响 专利 引用 关系 形成 的 因素 归纳 为 三 类 :专利 自 
身 的 属性 .专利 引文 网 络 的 自 组 织 过 程 ` 以 及 引文 网 络 
受 外 部 因素 影响 的 过 程 '” 。 本 文 从 关系 形成 理论 这 
个 视角 出 发 ,通过 梳理 相关 文献 ,提炼 出 五 类 影响 专利 
引用 关系 形成 的 机 制 , 这 里 所 说 的 机 制 主要 由 两 部 分 
组 成 :包括 影响 专利 引用 关系 形成 的 因素 ,以 及 这 些 因 
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素 对 于 专利 引用 关系 形成 的 效应 。 需 要 说 明 的 是 这 五 
类 机 制 并 不 是 排他 的 ,未 来 可 以 根据 研究 的 需求 进行 
调整 。 

机 制 一 ;专利 属性 的 主 效应 (main effects), EZ 
应 主要 是 用 来 测量 节点 属性 对 于 关系 形成 的 影响 。 本 
研究 中 主要 关注 于 两 种 专利 属性 特征 ,分 别 是 专利 权 
利 要 求 项 的 数量 以 及 专利 参考 文献 的 数量 ,相关 人 研究 
认为 专利 权利 要 求 反映 了 技术 排他 权 的 边界 ,而 参考 
文献 则 呈现 了 专利 对 现 有 技术 的 依赖 程度 ”。 目 前 ， 
相关 研究 已 经 证 明了 权利 要 求 项 数量 对 于 专利 被 引 频 
次 具有 正 向 影响 作用 '" ,同样 ,专利 参考 文献 数量 对 
于 专利 被 引 频 次 也 具有 正 向 影响 作用 ”。 与 标准 统计 
分 析 不 同 ,ERGM 模型 关注 节点 对 之 间 的 关系 ， 因此 ， 
主 效应 所 测量 的 统计 量 是 专利 对 属性 的 汇总 值 , 而 非 
单个 专利 的 属性 值 。 

机 制 二 ;专利 引用 时 间 的 差 值 效应 
effects) 。 以 往 的 研究 证 明了 专利 引文 具有 队列 效应 
(cohort effect) , 即 专利 被 引 的 数量 随 着 时 间 增 长 而 增 
长 。 专 利 引 文 时 滑 常 被 用 于 测量 技术 的 技术 生命 周 
期 ,解释 创新 的 速度 或 者 技术 发 展 的 速度 ,相关 研究 显 
示 ,专利 有 引用 较 新 专利 的 倾向 ,表现 在 引文 时 沿 上 也 
就 是 说 专利 引文 时 潍 间 隔 短 的 专利 更 易于 形成 专利 引 
用 关系 “"“ 。 具 体 到 网 络 效应 上 ,专利 引文 时 滞 可 以 
表现 为 :专利 引用 对 所 对 应 的 授权 年 之 间 差 值 对 专利 
引用 关系 形成 的 影响 。 

机 制 三 :专利 引用 关系 的 聚敛 效应 
effect) 。 前 问 引 文 数量 (被 引 频 次 ) 由 于 在 一 定 程度 上 
反映 了 该 专利 后 续 的 技术 影响 力 ,一 直 以 来 都 是 研究 
关注 的 焦点 “"”。 对 应 到 引文 网 络 中 ,专利 引用 关系 
聚敛 效应 是 对 前 向 引文 数量 分 布 网 络 结构 层面 的 刻 
画 , 它 将 高 被 引 的 专利 视 为 具有 星 状 结构 的 网 络 局 部 
配置 (从 中 心 节 点 链接 人 两 条 或 者 多 条 弧 ) ,从 而 观察 
这 种 配置 对 于 网 络 关 系 形 成 的 影响 ,如 “ 富 人 俱 乐 
部 ”” 或 者 “倾向 链接 ”“ ”现象 ,上 述 问题 正 是 聚敛 效 
应 要 测量 的 内 容 。 因 此 ,机 制 三 是 指 专利 对 之 间 形 成 

聚敛 结构 对 专利 引用 关系 形成 的 影响 。 

机 制 四 :专利 引用 关系 的 传递 效应 
effect) 。 传 递 效 应 主要 观察 的 是 一 种 特殊 的 网 络 局 部 
配置 一 一 传递 闭合 (transitivity closure )。 传 递 闭合 是 
一 种 纯 网 络 结构 特征 ,早期 研究 主要 是 通过 聚集 系数 
等 指标 对 其 进行 测量 的 。 在 引文 网 络 中 ,传递 闭合 表 
现 为 两 个 方面 特点 :一 方面 ,传递 闭合 是 在 2 - 路 径 构 
造 基础 增加 的 一 条 弧 ,该 弧 的 增加 使 得 “遗失 链接 ” 显 


( difference 


( activity 


( transitivity 
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性 化 ,构造 内 部 的 关系 更 为 稳健 ,该 特征 可 以 用 于 分 析 
专利 技术 的 演化 路 径 ” ; 另 一 方面 ,传递 闭合 构造 中 ， 
度 分 布 并 不 均匀 , 某 些 节点 具有 更 多 的 人 度 ,而 这 种 在 
传递 闭合 构造 中 的 入 度 优势 要 优 于 单纯 聚敛 效应 构造 
中 的 入 度 优势 ,于 是 ,传递 效应 也 可 用 于 识别 知识 流动 


ERGM 是 在 对 有 序 的 局 部 网 络 配置 进行 观察 基础 
上 的 建 模 ,通过 特定 的 参数 估计 过 程 ,局 部 网 络 配 置 所 
对 应 的 参数 值 可 以 被 计算 出 来 ,从 而 实现 对 于 复杂 网 
络 结构 的 统计 推断 过 程 。ERGM 从 理论 上 解决 了 传统 
方法 无 法 对 复杂 网 络 条 件 下 混合 变量 (同时 包含 多 个 


过 程 中 的 源头 ”-” 。 因 此 ,机 制 四 是 指 专利 对 之 间 形 
成 传递 结构 对 专利 引用 关系 形成 的 影响 。 

机 制 五 :专利 引文 网 络 的 网 络 协同 效应 ( Covariates 
effect) 。 与 上 述 机 制 不 同 , 网 络 协 同 效应 不 是 指 专利 
引文 网 络 内 部 的 网 络 结构 特征 ,而 是 以 其 他 网 络 与 专 
利 引 文 网 络 之 间 的 协同 特征 为 观察 对 象 的 。 现 有 相关 
研究 揭示 了 专利 权 人 、 专 利 发 明 人 地 理 位 置 上 的 临 
近 ” 与 专利 引用 关系 形成 之 间 有 相关 关系 , H. D. 
White 的 研究 进一步 确认 专利 引文 网 络 实际 是 由 两 种 
网 纵 结 构 特征 共同 作用 的 结果 , 即 社会 交流 结构 (social 
stiure ) 和 技术 交流 结构 (intellectual structure) P , 24 


然 仿 利 则 文本 的 语义 相似 性 也 能 在 一 定 程度 上 影响 专 


属性 变量 与 关系 变量 ) 的 评价 问题 ,能 够 在 全 网 层次 上 
解释 专利 引用 关系 的 成 因 , 因 此 ,就 有 可 能 做 出 更 准确 
的 预测 。 表 1 展示 了 如 何 将 影响 专利 引用 关系 产生 了 
五 种 机 制 转化 为 可 计量 的 网 络 统计 项 的 过 程 。 


3 ”数据 来 源 与 探索 
3.1 数据 来 源 

本 研究 关注 的 是 一 种 小 分 子 创新 抗 癌 药 物 ,其 药 
物 的 中 文 名 是 奈 拉 滨 ( Nelarabine) ,其 在 美国 上 市 的 商 


品名 为 Arranon( 阿 仑 恩 )。 之 所 以 选择 奈 拉 滨 是 出 于 
如 下 考虑 : 
药物 研发 过 程 会 经 历 多 个 过 程 ,一 个 完整 的 生命 


HERRER 。 因 此 ,机 制 五 是 指 专利 对 之 间 其 
他 网 络 关系 对 专利 引用 关系 形成 的 影响 。 

26D 影响 机 制 到 网 络 局 部 构造 

入 ERGM 是 一 种 以 关系 形成 为 对 象 的 研究 方法 ,其 
REEF 1959 年 P. Erdos 和 A. Renyi 提出 的 社会 网 络 


周期 通常 15 - 20 年 左右 ,因此 ,一 些 药物 自身 的 特点 ， 
如 早期 药物 研发 阶段 的 技术 转移 ,临床 IIILVII 期 的 审 
查 结果 ,药物 潜在 的 适用 证 范围 .药物 商业 化 阶段 的 转 
移 ( 融 资 \ 并 购 ) 商品 化 后 期 毒性 ` 药 效 方面 的 负面 报 
道 以 及 药物 的 更 新 换代 专利 到 期 导致 的 "专利 悬崖 ” 


统 评 分 析 模型 ,1996 4E S. Wasserman 将 上 述 模型 扩展 
成 蓄 可 以 包含 图 中 任何 统计 配置 的 ERGM/p 模型 ， 
1996.4 J. Anderson 提出 了 对 上 述 模型 的 参数 化 估计 
关 蝶 使 得 模型 有 了 重要 的 进展 59 。ERCGM 是 一 个 可 
以 扔 据 研究 内 容 进 行 调整 的 扩展 模型 ,其 最 一 般 的 形 
式 的 : 


Pr(Y=7) = (Jet E m eid} ARO) 
其 中 , 求 和 是 包含 所 有 的 配置 A 的 加 总 ,m4 是 对 
应 的 配置 A 的 参数 ,该 参数 可 以 用 来 判定 观测 网 络 中 
特定 网 络 统计 量 的 影响 力 ,8 (7) = TT, .4 是 对 应 配 
置 的 网 络 统计 量 ,x 是 标准 化 常数 ,确保 公式 为 适当 的 
概率 分 布 ” 。 简 单 说 来 ,ERGM 模型 的 核心 任务 就 是 
给 具有 某 些 特定 机 制 组 合 的 网 络 赋予 权 值 的 过 程 。 
此 ,上 式 也 可 以 写成 一 种 条 件 Logit 的 形式 : 
Logit(P(Y,=1 | n patent ,Y,°)) = È n, 684 (y) 
公式 (2) 
其 中 ,Y,“ 表示 网 络 中 除了 之 外 的 其 他 链接 关系 ， 
而 6g, Cy) 则 表示 当 和 链接 YA O 到 1 变化 时 gi 的 变化 
值 ,因此 公式 (2) 的 含义 是 在 网 络 中 其 他 连 线 已 经 确 
定 条 件 下 ,预测 一 条 新 的 连 线 出 现 的 概率 。 


等 都 可 能 潜在 影响 某 个 药物 相关 专利 的 规模 与 引文 网 
络 的 特征 “” ,也 会 使 得 ERGM 模型 发 现 的 引用 关系 
形成 的 特点 可 能 会 存在 偏差 (bias)。 因 此 ,在 药物 案 
例 选 择 时 我 们 希望 尽 可 能 从 简单 药物 入 手 逐 步 深入 ， 
这 里 ,我 们 考虑 了 筛选 一 个 简单 药物 的 三 个 条 件 :从 研 
发 到 生产 环节 相对 简单 , 尽 可 能 少 涉及 合并 、 转 移 ; 药 
物 的 适应 症 范围 较 罕 ,负面 毒性 ` 药 效 报道 相对 较 少 ; 
为 了 要 更 全 面 观察 专利 引文 网 络 ,观察 期 要 截止 到 药 
物 核 心 专利 到 期 后 一 段 时 期 。 

该 药物 的 早期 药物 研发 阶段 主要 是 美国 国家 癌症 
研究 所 和 Glaxo Wellcome 合作 开展 的 ,该 项 研发 方 Gl- 
axo Wellcome 和 SmithKline Beecham 与 2000 年 合并 形 
成 GlaxoSmithKline( 即 葛 兰 素 史 克 公 司 ) 。 虽 然 在 早期 
药物 研发 阶段 ,该 药物 研发 活动 中 存在 多 主体 参与 的 
现象 ,但 由 于 核心 专利 均 是 在 2005 年 之 后 产生 的 ,引文 
也 是 在 2006 年 之 后 出 现 的 ,因此 ,早期 药物 研发 活动 中 
的 多 参与 主体 特征 并 不 会 对 本 研究 中 的 引文 关系 形成 
产生 较 大 影响 ”。 另 外 , 虽 2015 年 以 后 奈 拉 滨 药物 研 
发 及 生产 团队 由 诺华 收购 ,但 由 于 是 整体 收购 ,该 药物 
的 研发 .生产 环节 仍 完 全 由 原 葛 兰 素 史 克 公 司 团队 所 控 
制 , 因 此 ,也 不 会 对 最 终 引 文 关系 形成 产生 较 大 影响 。 
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表 1 影响 专利 引用 关系 形成 五 种 机 制 ( 结构 效应 ) 对 应 的 网 络 构造 表 
nee 机 抽 P pe PESAD 
机 制 (影响 因素 ) ( 待 检验 效应 ) 参数 网 络 配置 图 示 统计 项 计算 公式 
专利 对 ( 施 引 ) 权利 要 求 项 数量 和 越 大 主 效 应 Nodeicov (claims ) Steen 
越 可 能 会 产生 引用 关系 o-o Z jito 
USERE n 年 的 专利 之 间 越 差 值 效 应 Absdiffeat (year. _ 
ad ine n 年 的 专利 之 间 越 可 差 值 效应 bsdiffcat (year. n) e Zain- 
haai 布 对 专利 引用 关系 聚敛 效应 Gwidegree $ oS 1 -(1-e-%) il X x 43) 
ys 
专利 对 之 间 的 传递 闭合 结构 对 于 专利 传递 效应 Gwesp R a -2 sasi 
引用 关系 形成 的 影响 / g 2 |1-(1-e7*)"} CE d Ma xy) 
eee 网 络 协同 效应 Edgecov (famnet) ° Zari 
会 广 生 5| 用 -一 一 人 


TRI F 2005 年 10 月 被 FDA 批准 上 市 ,是 
Fh FDA 特殊 审批 流程 的 孤儿 药 ( 即 用 于 治疗 罕见 疾 
病 的 药物 )"” ,该 药物 的 适应 症 是 :用 于 治疗 至 少 两 种 
洽 泣 方案 无 效 或 治疗 后 复发 的 T 细胞 急性 淋巴 细胞 性 
EATS (T-ALL ) 和 T 细胞 淋巴 母 细胞 性 淋巴 瘤 (T- 
LBB) ,该 药物 潜在 的 适用 症 范围 有 限 。 根 据 相 关 文 
MEERY T 细胞 恶性 肿瘤 的 有 效 药物 ,各 期 临床 斌 
验 网 取得 了 较 好 的 效果 ,主要 面临 的 问题 是 需要 通过 
调整 剂量 来 控制 神经 毒性 的 风险 。 后 期 的 研究 主要 是 
集中 在 组 合用 药 上 ,根据 当前 的 研究 尚未 出 现 对 于 该 
药 阮 完全 替代 性 新 药 ” 。 

“到 利用 PubChem 化 合 物 结构 数据 库 ( PubChem Com- 
pogi Database) 进行 检索 ,检索 策略 选择 奈 拉 滨 药物 


anj 
a 


nl 和 Jonih. gov/compound/301 1155 ) ,可 以 获得 关于 该 药 
物 两 方面 的 专利 信息 ,首先 ,是 核心 专利 信息 ,主要 是 
FDA 橙 皮 书 中 公开 的 核心 专利 信息 ,另外 ,该 数据 库 也 
提供 一 个 根据 化 合 物 结构 式 在 专利 全 文中 识别 出 的 相 


关 专 利信 息 ” ,截至 2017 年 12 月 31 日 ,检索 结果 显 
示 为 3 035 条 专利 相关 文献 。 在 数据 预 处 理 环节 ,本 
研究 限定 为 1998 年 - 2016 年 美国 专利 授权 数据 之 间 
的 引用 关系 ,最 终 ,数据 集中 包含 涉及 奈 拉 滨 药 物化 合 
物 的 1 165 项 美国 专利 授权 以 及 1 168 条 专利 引用 关 
系 。 数 据 补充 环节 ,主要 采用 Patents View 专利 数据 库 
(http ://www. patentsview. org/api/doc. html ) 以 及 美 
专利 局 (USPTO ) 授权 专利 数据 库 全 文 与 图 像 数 据 库 
(http ://patft. upsto. gov) 进行 数据 补充 。 经 数据 补充 
后 ,数据 集 被 进一步 加 工 为 网 络 数据 格式 ,其 由 两 个 数 
据 集 构 成 ,专利 属性 数据 与 专利 间 关 系数 据 。 

(1) 专 利 属性 数据 。 专 利 属性 数据 包含 了 4 个 字 
段 , 其 中 ,Patent_id 是 专利 数据 的 标识 符 ,其 他 三 个 字 
段 是 分 别 是 与 该 专利 相关 的 三 个 属性 信息 ,分 别 是 专 
利 授权 年 专利 权利 要 求 项 数量 以 及 专利 参考 文献 的 
数量 。 出 于 数据 标准 化 的 考虑 对 权利 要 求 项 以 及 参考 
文献 数量 分 别 进行 了 处 理 。 具 体 处 理 方式 参考 表 2。 


表 2 属性 数据 统计 项 及 其 解释 

统计 项 名 称 解释 最 小 值 最 大 值 平均 值 

patent_id 授权 专利 号 码 授权 专利 的 号 码 5424295 9527925 = 
year 专利 授权 年 专利 授权 年 1995 2016 2013 

claims 专利 权利 要 求 项 数量 (sqr2) 专利 权利 要 求 项 数量 的 平方 根 1 9 3.70 
references 专利 参考 文献 数量 (sqrt4 ) 专利 参考 文献 数量 的 四 次 方 根 0 5 2.23 
(2) 专利 间 关 系数 据 。 专 利 关 系数 据 ( 见 表 3) 包 含 3.2 数据 分 析 

了 5 个 字段 ,其 中 ,patent_id_ego 和 patent_id_alter 分 别 表 在 统计 建 模 之 前 ,利用 图 形 可 视 化 和 描述 性 统计 


示 关 系 的 两 端 ,这 里 由 于 专利 引用 关系 是 有 向 关系 ,因此 ， 
将 其 他 类 型 的 关系 均 转 化 为 有 向 关系 进行 处 理 。 关 系数 
据 中 包含 三 种 关系 ,分 别 是 专利 之 间 共 享 申请 人 关系 、 专 
利之 间 的 引用 关系 以 及 专利 之 间 共 享 专 利家 族 的 关系 。 
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方法 对 数据 进行 观察 是 非常 有 必要 的 。 相 关 研 究 发 
现 : 真 实 网 络 往往 与 随机 网 络 之 间 存 在 许多 结构 性 差 
异 , 这 些 差异 能 够 帮助 我 们 将 真实 网 络 与 简单 随机 网 
络 区 分 开 来 。 经 过 基本 的 数据 探索 ,我 们 发 现 奈 拉 滨 


杨 冠 灿 ， 刘 占 鹿 ,李纲 .基于 指数 随机 图 模型 的 专利 引用 关系 形成 机 制 研究 


2019 ,63( 10) :75 —86. 


表 3 关系 数据 统计 项 及 其 解释 
授权 专利 号 码 ( 链 出 ) 链 出 的 专利 号 码 5 
patent_id_alter 授权 专利 号 码 ( 链 入 ) 链 入 的 专利 号 码 = 


LERA ”如 果 链 入 与 链 出 的 专利 号 10 643 
码 之 间 至 少 包含 一 项 共同 

的 专利 发 明 人 ,就 认为 他 们 

具备 共享 发 明 人 关系 


rel_citing 利 引用 关系 受权 专利 之 间 的 引用 关系 1168 
rel_family 共享 专利 家 族 关系 ”如果 链 入 与 链 出 的 专利 号 ”472 
人 码 之 间 至 少 包含 一 项 共同 

的 专利 家 族 信息 ,就 认为 他 

门 是 共享 专利 家 族 关 系 

药物 专利 引文 网 络 在 上 述 五 种 机 制 上 均 表 现 出 于 随机 
网 络 不 同 的 网 络 结构 效应 : 

__(1) 专 利 属性 的 主 效应 特征 。 表 4 展示 了 专利 引 
用 对 之 间 各 自 对 应 的 专利 权利 要 求 项 数量 ,并 以 此 建 
TA RE A AE ME (Confusion matrix) , 即 针对 具有 不 同 
专利 权利 要 求 数量 的 专利 引用 对 各 种 可 能 组 合 的 形式 
进 和 统计 ,检验 专利 引用 对 在 引用 关系 形成 上 是 否 受 
到 下 专利 权利 要 求 项 数量 属性 特征 的 影响 。 在 表 4 
中 = 列 表示 代表 的 是 专利 引用 对 中 的 施 引 方 ,而 行 则 是 
仿 省 了 专利 引用 对 中 的 被 引 方 。 不 难 观察 到 在 该 泥 清 
短 除 中 ,左上 部 分 矩阵 块 中 ( 行 1-5 与 列 1 -5) 的 数 
所 普度 更 高 ,该 特征 似乎 说 明 : 权 利 要 求 项 数量 较 少 的 
专利 之 间 建 立 引用 关系 的 概率 高 。 同 时 ,我 们 进一步 
W, RIER 4 的 左上 部 分 矩阵 块 中 ,对 角 线 的 上 三 
角 牙 区 域 较 对 角 线 下 三 角形 区 域 的 数据 密度 明显 更 
高 > 沪 特 征 可 能 说 明 , 权 利 要 求 项 数量 偏 低 的 专利 更 有 
可 能 被 引用 。 当 然 , 这 个 结论 还 需要 通过 模型 进行 检 
验 。 同 时 ,对 专利 参考 文献 进行 观察 时 也 发 现存 在 类 
似 的 主 效应 特征 。 


统计 项 


patent_id_ego 


R 


rel_inventor 


表 4 专利 引用 对 之 间 基 于 专利 权利 要 求 


项 数量 的 混淆 矩阵 
被 引 专利 权利 要 求 项 数量 
施 引 1 2 3 4 5 6 7 8 9 行 汇总 
1 23 41 4 #14 #12 6 0 2 0 14 
2 27 49 79 40 #17 17 6 4 1 «240 
专 
利 3 16 34 61 53 24 22 10 6 2 228 
KL 4 11 17 52 118 52 22 17 6 0 295 
利 5 9 23 24 32 36 13 9 3 1 150 
要 
6 5 9 8 15 5 15 6 9 1 B 
求 
项 7 1 0 5 9 7 3 3 2 0 30 
数 8 0 0 1 1 1 0 1 0 0 4 
i 
9 0 0 1 0 0 0 0 0 0 1 
列 汇总 92 173 280 282 154 98 52 32 5 1168 


(2) 专利 引用 对 的 时 序 特征 。 由 于 整个 引文 跨度 
较 长 ,但 奈 拉 滨 药物 引文 网 络 早期 施 引 与 被 引 都 较 少 ， 
因此 ,为 了 更 显著 的 表现 引文 时 沾 的 特点 , 表 5 中 仅 截 
选 了 2007 年 至 2016 年 间 的 专利 引用 关系 进行 展示 
(引用 关系 数量 为 1 076)。 通 过 建立 施 引 专利 与 被 引 
专利 之 间 基 于 授权 时 间 的 混淆 矩阵 ,能 够 比较 清晰 的 
观察 专利 授权 专利 之 间 在 时 间 上 的 特征 。 通 过 对 表 5 
的 观察 ,我 们 可 以 发 现 两 点 :该 药物 的 专利 施 引 ( 表 5 
行 汇 总 ) 是 从 2013 年 之 后 开始 爆发 ,2012 年 的 专利 
施 引 量 仅 为 26 ,而 2013 年 后 专利 施 引 量 113 ,说 明 ， 
2013 年 以 后 该 药物 逐步 成 为 药物 研发 领域 的 关注 热 
点 ;其 次 ,围绕 在 邻接 矩阵 对 角 线 区 域 的 2 -5 年 范围 
存在 一 个 高 密集 区 域 ,该 密集 区 域 可 能 说 明 专 利 引 
文 的 时 清 存 在 一 个 间隔 期 的 俩 好 , 即 专利 引用 关系 
更 倾向 在 授权 时 间 间 隔 为 2-5 年 范围 内 的 专利 之 间 
发 生 。 


表 5 专利 引用 对 之 间 基 于 专利 授权 年 份 的 混淆 和 矩阵 (2007 年 -2016 年 ) 


被 引 专利 的 授权 年 份 
施 引 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 行 汇总 
2007 0 - m = = - - = = = 0 
2008 1 0 - 7 - - - - z - 1 
2009 6 2 2 = = - - 7 7 = 10 
2010 1 2 2 1 = = = = = > 6 
专利 的 2011 3 5 10 8 0 = = = = = 26 
授权 2012 1 2 7 5 10 2 = = = = 27 
ED 2013 2 13 9 21 36 26 6 = = = 113 
2014 2 6 9 13 19 25 37 1 - = 112 
2015 1 13 8 21 33 42 125 47 10 - 300 
2016 4 T 7 13 36 57 104 121 92 40 481 
列 汇总 21 50 54 82 134 152 272 169 102 40 1 076 
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G) 专利 引文 网 络 呈 现 整体 稀 琉 与 局 部 聚集 特 
征 。 首 先 ,网 络 的 密度 仅 为 0.000 867 说 明 该 网 络 是 一 
个 整体 较为 稀 玻 的 网 络 。 图 1a 展现 了 原始 的 奈 拉 滨 


1b 和 图 1c 展现 的 是 经 过 权威 得 分 (Authority ) 与 枢 
纽 得 分 (Hub) 算 法 "计算 后 ,对 网 络 中 的 节点 大 小 进 
行 缩放 后 的 图 像 ”。 通 过 比较 图 1 的 三 幅 图 像 ,我 们 


药物 专利 引文 网 络 整体 稀 玻 的 特征 , 即 并 不 存在 高 度 
聚敛 的 中 心 节 点 ,部 分 高 密度 区 域 的 影响 范围 有 限 。 


a. 原始 专利 引文 网 络 


b. 枢纽 得 分 加 权 专 利 引文 网 络 


观察 到 在 网 络 的 局 部 的 高 密度 区 域 中 ,部 分 专利 间 的 
施 引 与 被 引 非常 频 索 ,存在 局 部 聚集 特征 。 


c. 权威 得 分 加 权 专 利 引 文 网 络 


图 1 奈 拉 滨 药物 专利 引文 网 络 局 部 聚集 特征 展示 


三 (4) 网 络 协同 机 制 。 首 先 ,如 图 2 所 示 , 我 们 比较 
了 下 各 专利 引文 网 络 :专利 引用 网 络 , 共 享 发 明 人 的 专 
和 引文 网 络 ,以 及 共享 家 族 关系 的 专利 引文 网 络 。 从 
寺中 ,不 难 观察 到 三 种 专利 引文 网 络 的 一 些 基本 特 


的 核心 成 分 ,共享 专利 家 族 关 系 的 专利 引文 网 络 则 显 
得 非常 的 杂乱 ,从 图 形 2b 几乎 无 法 发 现任 何 网 络 结构 
特征 。 但 当 进一步 计算 三 种 网 络 的 自 相 关 和 矩阵 时 ( 见 
表 6) ,专利 引文 网 络 与 共享 专利 家 族 关 系 的 专利 引文 


征 . 尤 其 是 图 2c 中 所 示 的 共享 发 明 人 的 专利 引文 网 络 
展 卉 了 一 个 紧密 连接 的 核心 成 分 ( Component) ,说 明 在 
伦 闵 滨 药物 专利 引文 网 络 中 存在 一 个 存在 高 度 自 引 倾 
各 的 “小 圈子 ” ,在 这 个 “小 圈子 "内 的 任何 存在 引用 关 
系 的 专利 引用 对 至 少 有 一 个 发 明 人 是 相同 的 ( 即 两 篇 
专利 共享 发 明 人 的 关系 ) 。 由 于 高 度 自 引 特 征 一 定 程 
遍 改 反映 了 该 药物 技术 发 展 对 现 有 技术 的 依赖 程度 ， 
视 核 心 研发 团队 对 于 专利 引用 关系 形成 具有 重要 影 


响 = 于 是 ,这 种 高 度 自 引 特 征 就 成 为 后 续 统计 推断 过 程 
需 加 重要 关注 的 内 容 。 
相对 于 共享 发 明 人 专利 引文 网 络 呈 现 出 较为 清晰 


网 络 之 间 存 在 0.301 的 自 相 关 关 系 ,与 此 同时 ,专利 引 
文 网 络 与 共享 发 明 人 专利 引文 网 络 之 间 仅 存在 0. 193 
的 自 相关 关系 ;尤其 是 三 个 网 络 中 关系 数量 的 分 布 并 
不 是 均匀 的 ,共享 发 明 人 专利 引文 网 络 的 关系 数量 是 
10 643 条 ;共享 专利 家 族 专利 引文 网 络 的 关系 仅 为 472 
条 。 当 将 上 述 两 条 信息 结合 起 来 考虑 ,不 难 想象 ,专利 
引文 网 络 与 共享 专利 家 族 关系 的 专利 引文 网 络 之 间 是 
存在 某 种 高 度 协同 性 的 ,而 这 种 协同 性 与 结构 特征 无 
关 , 可 能 暗示 存在 茶 种 强 规则 或 业务 逻辑 对 专利 引文 
形成 产生 了 影响 ,当然 ,上 述 判断 也 需要 依据 网 络 统计 
推断 进行 确认 。 


a. 原始 专利 引文 网 络 


图 2 


表 6 三 种 网 络 关 系 的 自 相 关 和 矩阵 


b. 共享 专利 家 族 专 利 引文 网 络 
三 种 专利 引文 网 络 协同 效应 展示 
另 一 个 值得 一 提 的 问题 :如 何在 数据 探索 阶段 发 


c. 共享 发 明 人 专利 引文 网 络 


共享 发 明 人 利 引 # 享 家 族 关系 现 网 络 协同 效应 的 存在 ? 发 现 哪 些 网 络 与 专利 引用 关 
SEANA XE IEE 系 网 络 具有 协同 作用 并 不 是 一 个 非常 直观 的 过 程 。 一 
共享 发 明 人 专利 引文 网 络 1 0. 193 0. 161 sons X PES 
专利 引文 网 络 0. 193 1 0.301 个 经 验 是 我 们 在 早期 针对 专利 引文 属性 特征 进行 探索 
共享 家 族 关系 专利 引文 网 络 0-161 0.301 1 时 ,发 现 一 些 现 有 文献 中 非常 显著 的 属性 特征 ,如 专利 
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发 明 人 数量 .专利 家 族 规 模 的 效果 并 不 理想 ,因此 ,我 
们 并 不 是 直接 采用 专利 引用 对 之 间 在 属性 特征 是 否 存 
在 主 效应 、 差 值 \ 同 质 或 异 质 作为 统计 特征 ,而 是 通过 
观察 引用 关系 对 之 间 是 否 共享 发 明 人 或 者 贡献 专利 家 
族 关 系 来 构建 网 络 , 然 后 ,测量 上 述 两 个 网 络 与 专利 引 
用 关系 网 络 之 间 的 协同 性 。 通 过 这 个 转化 过 程 很 多 时 
候 可 以 获得 意 想 不 到 的 效果 。 


4.1 参数 估计 

模型 评价 是 贯穿 整个 建 模 过 程 的 一 个 重要 环节 ， 
通常 而 言 ,ERG 模型 的 研究 过 程 是 :首先 将 零 模型 ( 随 
机 生成 的 网 络 ) 作 为 基线 模型 ,然后 ,逐步 增加 不 同 机 
制 对 应 的 网 络 统计 项 形成 新 的 模型 ,并 利用 ERG 模型 
对 宇 述 模型 进行 参数 估计 ,最 终 , 对 多 个 模型 的 结果 进 
FDI SUA ED OY LORE SRE. KE R 的 
sh 包 对 表 7 中 的 各 项 模型 进行 参数 估计 ,其 中 , 堆 
模型 、 主 效应 模型 . 差 值 模型 以 及 协同 关系 模型 均 是 采 
用 的 是 最 大 似 然 估计 方法 进行 参数 估计 ,而 对 于 几何 
加 醒 模 型 则 是 采用 马尔 可 夫 链 蒙特 卡 罗 极 大 似 然 估计 
(Mem MLE) 5 
C ET 是 五 种 模型 的 统计 摘要 表 。 通过 对 五 种 模型 
绪 洋 摘要 的 比较 ,尤其 是 对 网 络 的 参数 估计 值 及 其 统 
计量 著 性 的 分 析 , 可 以 获得 对 网 络 统计 项 的 初步 统计 
WR, “专利 对 ( 施 引 ) 权利 要 求 项 数量 和 "在 全 部 模 
型 审 均 显示 为 显著 且 负 向 ,说 明 当 其 他 条 件 不 变 的 情 
况 下 ,在 专利 对 ( 施 引 ) 权利 要 求 项 数量 和 越 大 ,他 们 
之 同 建立 引用 关系 的 概率 就 越 小 ;“ 专 利 对 ( 施 引 ) 参 
考 文献 数量 和 ”在 全 部 模型 中 均 显示 为 显著 且 正 向 ,说 
明 当 其 他 条 件 不 变 的 情况 下 ,在 专利 对 ( 施 引 ) 参考 文 
献 数量 和 越 大 ,他 们 之 间 建 立 引用 关系 的 概率 就 越 大 ; 
同时 ,需要 注意 的 是 : “专利 对 (被 引 ) 参考 文献 数量 
和 ”在 除 几 何 加 权 模 型 外 的 其 他 模型 中 均 显示 为 显著 
晶 正 向 ,可 能 的 解释 是 当 模 型 加 入 几何 加 权 入 度 分 布 
或 几何 加 权 边 共享 伙伴 统计 项 后 ,可 能 在 上 述 三 种 因 
素 之 间 存在 某 种 程度 的 相关 关系 。 差 值 模型 中 的 前 两 
项 “引文 时 滞 (2 年 )”“ 引 文 时 滞 (3 年 )” 在 全 部 模型 
中 均 显示 为 显著 且 正 向 ,说 明 专 利 对 之 间 如 果 授 权时 
间 之 间 间 隔 不 超过 3 年 ,那么 他 们 之 间 建 立 引用 关系 
的 概率 就 越 大 ; 值得 关注 的 是 后 两 项 “引文 时 滞 (4 
年 )”“ 引 文 时 滞 (5 年 )”, 当 模型 加 入 几何 加 权 入 度 分 
布 或 几何 加 权 边 共 享 伙伴 统计 项 后 , “引文 时 灌 (4 
年 )” 则 不 显著 了 ,可 能 的 解释 是 几何 加 权 入 度 分 布 或 


几何 加 权 边 共享 伙伴 统计 项 与 引文 引文 时 沾 (4 年 ) 之 
间 存 在 相关 因素 。“ 共 享 专利 家 族 关系 ”与 “共享 发 明 
人 关系 ”在 协同 关系 模型 和 几何 加 权 模 型 下 都 呈现 为 
显著 且 正 向 ,说 明 当 其 他 条 件 不 变 的 情况 下 ,在 专利 对 
之 间 如 果 存 在 “共享 专利 家 族 关系 ”或 者 “共享 发 明 人 
关系 ”, 那 么 ,他 们 之 间 建 立 引 用 关系 的 概率 就 越 大 , 男 
外 值得 注意 的 是 , “共享 专利 家 族 关 系 ” 与 “共享 发 明 
人 关系 ”的 参数 值 非常 高 ,分 别 为 (2.8,2.9) 以 及 
(6.34,5.41) 这 说 明 这 两 项 网 络 协 同 机 制 对 于 建立 引 
用 关系 具有 非常 大 的 正 向 影响 。 最 后 ,“ 几何 加 权 入 度 
分 布 "为 显著 负 向 ,专利 节点 对 之 间 建 立 引 用 关系 的 概 
率 要 小 于 随机 发 生 引 用 关系 的 概率 ,但 “几何 加 权 边 共 
享 伙 伴 ” 则 为 显著 正 向 ,专利 对 之 间 建 立 引 用 关系 的 概 
率 要 大 于 随机 发 生 引用 关系 的 概率 ,看 起 来 似乎 矛盾 ， 
但 综合 起 来 实际 上 进一步 说 明 网 络 结构 上 整体 稀 玻 与 
局 部 聚集 特征 并 存 的 现象 。 

4.2 ”模型 诊断 

模型 诊断 (model diagnostics ) 能 够 辅助 判断 估计 算 
法 是 否 已 经 收敛 还 是 存在 近似 退化 问题 ,进而 判断 究 
竟 是 模型 本 身 还 是 模型 评价 设置 条 件 需 要 进行 调 
Bee) 图 3 展示 几何 加 权 模 型 部 分 统计 项 在 模型 最 
后 迭代 阶段 呈现 的 状态 。 在 图 3 左 侧 的 绘图 ,以 模型 
中 的 每 一 个 统计 项 为 单位 ,利用 MCMC 链 作 一 个 时 间 
序列 来 展示 统计 项 的 变化 情况 ,图 3 右 侧 的 绘图 则 显 
示 了 对 应 MCMC 链 的 分 布 图 。 如 果 模 型 能 够 收敛 , 模 
型 中 每 一 个 统计 项 的 图 表 将 会 表现 为 以 0 为 中 心 随机 
变化 ,这 里 0 代表 观测 网 络 对 应 统计 项 的 统计 值 。 在 
人 
随机 变化 的 ,因此 ,模型 诊断 的 结果 显示 几何 加 权 项 模 
型 是 一 个 稳定 的 模型 。 
4.3 ”模型 拟 合 

虽然 ,在 参数 估计 环节 一 些 网 络 统计 项 已 经 表现 
出 了 统计 上 的 显著 性 ,并 且 反 映 出 了 一 些 与 前 期 根据 
探索 性 分 析 所 观察 出 的 模式 一 致 的 特征 ,对 于 模型 的 
效 度 已 经 进行 了 初步 的 检验 ,但 还 需要 更 为 系统 地 的 
检验 :究竟 仿真 模型 能 够 在 多 大 程度 上 反映 观察 网 络 
的 结构 特征 。 下 面 ,我 们 将 从 两 个 方面 对 模型 的 拟 合 
优 度 进行 评价 : 

(1) 利 用 AIC FI BIC 统计 结果 进行 拟 合 优 度 的 评 
价 。AIC 和 BIC 方法 是 基于 对 数 似 然 估 计 结 果 的 , 即 
观测 网 络 中 Yj 真实 发 生 的 联系 ) 概率 与 Yij 的 期 望 
概率 之 间 的 差异 。 根 据 表 7, 零 模型 的 AIC 是 18 806, 
主 效 应 模型 的 AIC 是 17 640 , 较 之 前 的 零 模型 有 较 大 
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表 7 零 模型 \ 主 效应 模型 、 差 值 模型 \ 协 同 关 系 模型 .几何 加 权 模 型 的 统计 摘要 表 


参数 估计 值 (SE) 
效应 类 别 网 络 统计 项 名 称 (statnet) 
零 模 型 主 效 应 模型 值 模型 ” 协同 关系 模型 ”几何 加 权 模 型 
ah Are -7.049 -9.751 -10. 158 -11.761 -9.463 
0.02 *** 0.14 *** 0.14 * 0. 16 * 0.14 = 
主 效 应 ”专利 对 ( 施 引 ) 权利 要 求 项 数量 和 Nodeocov(claims) - -0.248 -0.245 -0.171 -0.092 
0.01 *** 0.01 *** 0.02 *** 0.01 * 
专利 对 (被 引 ) 权 利 要 求 项 数量 和 Nodeicov (claims) z -0.014 = = _ 
0.01 
专利 对 ( 施 引 ) 参 考 文献 数量 和 Nodeocov (references ) 一 0.482 0. 473 0. 265 0. 064 
0.03 ** 0.03 *** 0.04 *** 0.03 *** 
专利 对 (被 引 ) 参 考 文献 数量 和 Nodeicov (references ) 一 0.950 0.947 0. 899 m 
0.03 *** 0.03 *** 0.04 *** 
差 值 效应 引用 时 滞 (2 年 ) Absdiffcat (year. 2) = = 0. 823 0. 852 0.58 
0.07 *** 0.08 *** 0.08 ** 
引用 时 滞 (3 年 ) Absdiffcat (year. 3) = = 0.570 0.746 0.476 
0.08 wa 0. 09 *** 0.09 *** 
5 | FAN (4 年 ) Absdiffcat (year. 4) - - 0. 450 0.619 - 
0. 10 *** 0.11 ** 
TY 5 | FAI YF CS 年 ) Absdiffcat (year. 5) 一 一 0.594 0.972 = 
> 0. 11 ** 0.13 *** 
CDi 共享 专利 家 族 关 系 Edgecov (famnet ) = - = 2.80 2.936 
y= 0.11 *** 0. 10 ** 
LO 共享 发 明 人 关系 Edgecov (invnet ) = - - 6.34 5.411 
O 0.08 = 0.09 *** 
Cees 几何 加 权 和 人 度 分 布 Gwidegree (a =0.3) - - = 三 -1.827 
n 0.11 ** 
Deza 几何 加 权 边 共享 伙伴 Gwesp (a =0.3) = 2 E 2 0.68 
O 0.05 *** 
O 赤 池 信息 准则 AIC 18 806 17 640 17 510 8 515 7 970 
N 贝 叶 斯 信息 标准 BIC 18 818 17 701 17 607 8 636 8 080 
N 
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dH HFI 


Chin we ERAT 


以 奈 拉 滨 药物 


提升 ; 差 值 模型 的 AIC 是 17 510 虽然 也 有 所 下 降 ,但 
较 之 前 的 主 效应 模型 改变 并 不 明显 ;协同 关系 模型 较 
之 前 的 差 值 模型 有 了 一 个 显著 的 降幅 ,AIC 下 降 到 了 
8 515 ,说 明 协 同 关 系 模型 中 的 两 种 机 制 共 享 专利 家 族 
与 共享 发 明 人 关系 的 协同 作用 对 应 ERG 模型 拟 合 优 
度 的 改进 具有 重要 的 作用 。 

(2) 然 而 ,AIC 与 BIC 等 方法 是 适合 于 以 独立 性 假 
设 为 基础 的 观测 数据 的 ,但 当 模 型 更 加 复杂 ,例如 几何 
加 权 模 型 增加 了 依赖 性 统计 项 时 ,就 需要 采用 基于 仿 
真 的 模型 拟 合 优 度 评价 方法 。 拟 合 优 度 评价 的 过 程 也 
可 以 采用 可 视 化 图 形 观察 的 方法 , 当 限 定 其 他 网 络 特 
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边 共 享 伙伴 


征 不 变 的 前 提 下 ,比较 观测 网 络 中 每 一 个 参数 的 对 数 
优势 比 以 及 仿真 网 络 中 对 数 优势 比 的 范围 。 图 4 的 组 
图 是 针对 几何 加 权 模 型 仿真 网 络 进行 拟 合 优 度 评价 的 
结果 。 其 中 ,黑色 线 代表 专利 引文 网 络 的 观测 结果 ; 灰 
色 线 以 及 箱 型 图 则 代表 了 仿真 网 络 在 95% 的 置信 区 
间 时 的 测量 结果 。 当 黑色 线 落 在 灰色 线条 之 间 时 ,说 
明 仿真 网 络 能 够 很 好 的 代表 真实 的 专利 引文 网 络 的 结 
构 特 征 。 因 此 ,图 4 的 组 图 说 明 ,仿真 网 络 基 本 上 能 够 
拟 合 真 实 网 络 的 四 种 结构 特征 (人 和 人 度 中 心 度 .出 度 中 心 
度 、 边 共享 伙伴 以 及 二 元 组 共享 伙伴 ) ,但 在 边 共享 伙 
伴 这 一 特征 上 和 真实 网 络 还 有 一 定 差异 。 
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二 元 组 共享 伙伴 


4 几何 加 权 模 型 拟 合 优 度 评价 的 图 形 化 观察 比较 


4.4 模型 解释 

本 研究 通过 比较 五 种 模型 ( 零 模型 .主将 应 模 ; 
差 值 模型 .协同 关系 模型 .几何 加 权 模 型 ) 的 多 个 统计 
结果 以 及 图 形 化 拟 合 优 度 指 标 ,我 们 发 现 几何 加 权 模 
型 具有 最 佳 的 网 络 仿真 效果 。 在 模型 构建 的 过 程 中 ， 
我 们 观察 到 模型 对 于 网 络 仿真 效果 改进 最 大 的 地 方 有 
三 处 :中 增加 协同 效应 的 统计 项 ,即将 专利 之 间 共 享 专 


@ 增 加 主 效应 特征 统计 项 , 即 考虑 属性 因素 对 于 专利 
之 间 建 立 引 用 关系 概率 的 影响 ,包括 专利 权利 要 求 项 
数量 以 及 专利 参考 文献 数量 ;(3 增 加 几何 加 权 统 计 项 ， 
即 考虑 入 度 分 布 , 边 共 享 伙伴 对 于 专利 之 间 建 立 引 用 
关系 概率 的 影响 。 

具体 而 言 ,从 ERG 模型 拟 合 优 度 改进 的 效果 来 解 
“共享 发 明 人 关系 ”统计 项 对 于 专利 引用 关系 形成 


利家 族 关 系 的 网 络 以 及 共 发 明 人 网 络 视 为 网 络 协 变量 
作为 统计 项 ,用 于 预测 专利 之 间 建 立 引 用 关系 的 概率 ; 


9 影响 是 最 大 的 。“ 共 享 发 明 人 关系 ”统计 项 所 代表 
a 
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效应 ,说 明 奈 拉 滨 药物 专利 引文 网 络 是 围绕 一 个 存在 
高 度 自 引 倾向 的 小 圈子 展开 的 ,该 小 圈子 在 网 络 中 同 
时 占据 了 枢纽 和 权威 的 位 置 (参见 图 1 和 图 2) ,于 是 ， 
可 以 说 该 小 圈子 的 发 展 决定 了 整个 奈 拉 滨 药 物 专利 引 
文 网 络 的 形态 。 

“共享 专利 家 族 关系 "统计 项 展现 了 对 专利 引用 
关系 形成 起 到 重要 的 另 一 个 重要 维度 , 即 专利 申请 背 
后 的 业务 逻辑 , 即 专利 申请 者 会 利用 衍生 专利 申请 来 
进行 专利 布局 ,如 采取 围栏 策略 ,用 以 扩大 专利 的 保护 
周期 。 这 种 规则 是 一 种 强 业 务 规则 ,我 们 无 法 从 网 络 
结构 特征 中 宕 见 端倪 (参见 图 2b 和 表 6) ,但 却 深刻 的 
影响 到 了 专利 引用 关系 的 形成 。 

“几何 加 权 边 共享 伙伴 "所 代表 的 专利 引用 关系 

的 传递 效应 类 似 于 “朋友 的 朋友 也 是 朋友 "。 对 于 引 
文 网 络 而 言 ,传递 效应 的 存在 并 不 难 理解 ,更 值得 关注 
的 起 在 于 在 几何 加 权 模型 中 ,由 于 增加 了 *“ 儿 何 加 权 边 
共 鲁 伙伴 "统计 项 ,网 络 中 其 他 统计 项 的 相对 影响 作用 
贞观 了 下 降 的 趋势 ,说 明 * 几 何 加 权 边 共享 伙伴 "统计 
项 对 某 些 统计 项 存在 一 定 程度 的 替代 作用 。 这 一 点 恰 
怪 是 指数 随机 图 模型 的 优势 所 在 能 够 分 析 存在 复杂 诬 
奏 尖 系 的 多 个 变量 给 出 统计 推断 ,这 一 点 是 传统 回归 
模型 无 法 胜任 的 。 
“当然 ,专利 属性 的 主 效应 机 制 也 是 存在 一 定 作 用 
的 之 例如 ,“ 专 利 对 ( 施 引 ) 权利 要 求 项 数量 和 ”与 “ 专 
生涯 ( 施 引 ) 权 利 要 求 项 数量 和 "两 项 专利 属性 的 主 效 
应 央 制 说 明 , 在 奈 拉 滨 药 物 专利 引文 网 络 中 ,专利 更 倾 
向 毛 引 用 哪些 权利 要 求 项 数量 较 少 的 专利 , 即 采用 主 
动 通 开 竞争 对 手 的 权利 要 求 范围 的 策略 2 ;同时 , 专 
利 更 倾向 于 引用 哪些 参考 文献 数量 较 多 的 专利 , 即 采 
用 主动 信息 披露 策略 ,避免 因 信息 披露 不 全 导致 在 后 
期 诉讼 环节 处 于 不 利 地 位 。 

专利 引用 时 间 的 差 值 效应 也 是 存在 一 定 作用 的 。 
“引用 时 灌 (2 年 )”" 和 “引用 时 灌 (3 年 )” 都 表现 出 显 
著 的 差 值 效应 ,这 一 点 在 专利 引文 中 非常 常见 ,但 需要 
注意 的 是 “引用 时 灌 (4 年 以 上 )" 统 计 项 则 在 加 入 专利 
引用 关系 的 聚敛 效应 ,传递 效应 机 制 后 不 再 显著 了 ,这 
表明 网 络 结构 特征 (如 聚敛 效应 ) 与 差 值 效应 之 间 存 
在 一 定 的 替代 作用 。 例 如 ,如 果 三 篇 专利 之 间 存 在 引 
用 关系 构成 了 一 个 传递 三 元 组 ,那么 三 元 组 中 两 篇 专 
利之 间 既 存在 直接 引用 关系 也 存在 间接 引用 关系 ,这 
种 情况 下 ,引用 时 汪 通 常会 比 仅 存在 直接 引用 关系 的 
专利 对 要 长 。 合 理 的 解释 是 虽然 专利 引文 网 络 中 存在 
一 部 分 专利 对 之 间 的 引用 时 灌 较 长 的 现象 ,但 这 些 引 


84 


对 之 间 往 往 也 同时 存在 传递 三 元 组 结构 ,因此 ,引用 
IN Hie (4 年 以 上 ) 统 计 项 对 在 考虑 了 传递 性 之 后 就 不 再 
显著 了 。 


5 ”结论 与 不 足 


本 文 尝试 使 用 了 一 种 新 的 统计 推断 方法 一 一 指数 
随机 图 模型 方法 ,该 方法 为 本 研究 提供 了 独特 视角 ,使 
得 本 研究 能 够 对 复杂 网 络 条 件 下 混合 变量 进行 综合 评 
价 , 从 而 能 在 更 广泛 的 层次 上 解释 专利 引用 关系 的 形 
成 问题 。 在 微观 结构 特征 设计 方面 ,本 文 考虑 了 五 种 
机 制 : 主 效 应 ` 差 值 效应 .协同 效应 ,聚敛 效应 ,传递 效 
应 ,这 五 种 机 制 涵盖 了 网 络 内 部 自 组 织 结构 特征 、 外 部 
网 络 协同 作用 以 及 专利 内 部 属性 特征 ,这 些 特征 存在 
多 重 关 系 与 高 度 藤 套 的 局 部 结构 ,是 传统 以 独立 性 假 
设 为 前 提 的 回归 模型 难以 胜任 的 。 

研究 的 主要 结论 如 下 :就 奈 拉 滨 药物 引文 网 络 而 
,专利 引用 关系 形成 主要 是 受到 了 三 方面 的 影响 :由 
共享 发 明 人 关系 与 专利 引用 关系 之 间 的 协同 效应 显示 
存在 一 个 具有 高 度 自 引 倾向 的 “小 圈子 ”, 这 个 小 圈子 
很 大 程度 上 影响 了 整个 奈 拉 滨 药 物 研 发 的 方向 ;共享 
专利 家 族 关系 与 专利 引用 关系 之 间 的 协同 效应 显示 专 
利 申请 背后 的 业务 逻辑 的 作用 一 一 利用 专利 家 族 进行 
布局 ;专利 引文 网 络 内 部 自 组织 网 络 特征 一 一 如 传递 
性 ,显示 专利 关系 的 形成 并 不 是 一 个 随机 过 程 ,而 是 对 
于 既 有 网 络 结构 有 着 较 强 的 依赖 性 。 

同时 ,在 奈 拉 滨 药 物 专 利 引 文 网 络 中 ,还 有 一 些 影 
啊 专 利 引 用 关系 形成 的 辅助 因素 也 非常 值得 关注 :网 
络 结构 特征 (如 传递 效应 ) 对 引文 时 滞 (4 年 以 上 ) 的 蔡 
代 作 用 ;专利 更 倾向 于 引用 权利 要 求 项 数量 较 少 的 专 
利 , 即 采用 主动 避 开 竞争 对 手 的 权利 要 求 范围 的 策略 ; 
同时 ,专利 更 倾向 于 引用 参考 文献 数量 较 多 的 专利 , 即 
采用 主动 信息 披露 策略 ,避免 因 信息 披露 不 全 导致 在 
后 期 诉讼 环节 处 于 不 利 地 位 。 

本 文 存在 一 定 的 研究 不 足 值得 未 来 研究 继续 深入 
探讨 。 首 先 ,本 研究 是 针对 一 个 特定 的 药物 的 ,因此 ， 
我 们 目前 所 发 现 的 所 有 对 于 专利 引用 关系 形成 的 解释 
仅 适 用 于 奈 拉 滨 药 物 专利 引文 网 络 , 不 具有 普 适 性 ,这 
种 局 限 性 是 由 指数 随机 图 模型 生成 模型 的 特点 所 决定 
的 。 但 如 果 我 们 能 够 同时 对 多 个 药物 进行 分 析 , 则 仍 
有 可 能 归纳 出 一 些 对 于 专利 引用 关系 形成 普 适 性 的 解 
释 。 针 对 多 药物 的 比较 研究 未 来 会 是 我 们 研究 的 一 个 
重要 方向 。 其 次 ,我 们 只 是 从 一 个 截面 数据 条 件 来 观 
察 专利 引用 关系 形成 ,未 来 的 研究 中 ,从 一 个 动态 视角 
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来 观察 专利 引用 关系 形成 的 影响 也 是 我 们 研究 的 一 个 

主要 方向 。 

参考 文献 : 

[ 1 ] OECD. OECD patent statistics manual[ M]. Paris; OECD Publish- 
ing, 2009. 


[ 2 ] JAFFE A B, DE RASSENFOSSE G. Patent citation data in social 


wu 


science research; overview and best practices[ J]. Journal of the 
Association for Information Science and Technology, 2017, 68 
(6): 1360 - 1374. 

YANG G C, LI G, LI C Y, Using the comprehensive patent cita- 


a 
we 
L_ 


tion network (CPC) to evaluate patent value[ J]. Scientometrics , 
2015, 105(3) ; 1319 - 1346. 

[4 ] VAN RAAN A F J. Patent citations analysis and its value in re- 
search evaluation; a review and a new approach to map technology - 


relevant research [J]. Journal of data and information science, 


32017, 2(1); 545 - 538. 

[ 6_DMoRRIS S A, VAN DER VEER MARTENS B. Mapping research 
i _ specialties[ J ] . Annual review of information science and technolo- 
= : 213 -295. 

OF: 2008, at 295 
[ 6 ARRIETA PAREDES M P, CRONIN B. Exponential random graph 


m 
Jamodels for management research; a case study of executive recruit- 


CÐment[J]. European management journal, 2017, 35 (3); 373 - 
Dz. 

[全 os KIM J Y, HOWARD M, COX PAHNKE E. Understanding 
C network formation in strategy research; exponential random graph 
S models[ J]. Strategic management journal, 2016, 37 (1); 22 - 
y. 

[coopFEA S M, HANDCOCK M S, BUTTS C T. Statnet: soft- 
(ware tools for the representation, visualization, analysis and simu- 
ation of network data[ J]. Journal of statistical software, 2008 , 24 
《9 1): 1 -11. 

[ 9 ] ROBINS G, PATTISON P, KALISH Y. An introduction to expo- 
nential random graph (p * ) models for social networks[ J]. Social 
networks, 2007, 29(2) : 173 - 191. 

[10] JAFFE A B, TRAJTENBERG M. Patents, citations, and innova- 
tions[ M]. New York; MIT Press, 2002. 

[11] ALCACER J, GITTELMAN M. Patent citations as a measure of 
knowledge flows; the influence of examiner citations[ J]. Review of 
economics and statistics, 2006, 88(4) ; 774 - 779. 

[12] ROBINS G. Doing social network research[ M]. London; SAGE, 
2015. 

[13] FISCHER T, LEIDINGER J. Testing patent value indicators on di- 
rectly observed patent value -an empirical analysis of Ocean Tomo 
patent auctions[ J]. Research policy, 2014, 43(3) : 519 - 529. 

[14] ALCACER J, GITTELMAN M, SAMPAT B. Applicant and exam- 
iner citations in U. S. patents: an overview and analysis J]. Re- 
search policy, 2009, 38(2) : 415 -427. 

[15] HALL B H, JAFFE A B, TRAJTENBERG M. The NBER patent 


citation data file; lessons, insights and methodological tools[ R ]. 
Cambridge: National Bureau of Economic Research, 2001. 

[16] BENSON C L, MAGEE C L. Quantitative determination of techno- 
logical improvement from patent data [ J]. Public library of sci- 
ence, 2015, 10(4) : e0121635. 


[17] CZARNITZKI D, HUSSINGER K, SCHNEIDER C. “Wacky” pa- 


Ei 


tents meet economic indicators[ J]. Economics letters, 2011, 113 
(2) + 131 - 134. 

[18] SMILKOV D, KOCAREV L. Rich-club and page-club coefficients 
for directed graphs[ J]. Physica a; statistical mechanics and its ap- 
plications, 2010, 389(11) : 2290 -2299. 

[19] BRANTLE T F, FALLAH M H. Complex innovation networks, pa- 
tent citations and power laws[ C |//PICMET ’ 07 - 2007 Portland 
international conference on management of engineering & technolo- 
gy. Portland; IEEE ,2007 ; 540 - 549. 

[20] WANG JC, CHIANG C H, LIN S W. Network structure of innova- 
tion; can brokerage or closure predict patent quality? [J]. Scien- 
tometrics, springer netherlands, 2010, 84(3) : 735 -748. 

[21] BATAGELJ V. Efficient algorithms for citation network analysis 
[ EB/OL ]. [2017 - 12 - 31]. https://arxiv. org/abs/cs/ 
0309023. pdf. 

[22] HUNG S W, WANG A P. Examining the small world phenomenon 
in the patent citation network ; a case study of the radio frequency i- 
dentification (RFID) network[ J]. Scientometrics, 2009, 82(1) : 
121 - 134. 

[23] ALMEIDA P, KOGUT B. The exploration of technological diversity 
and geographic localization in innovation ; start-up firms in the sem- 
iconductor industry[ J]. Small business economics, 1997, 9 (1 ) ; 
21-31. 

[24] WHITE H D, WELLMAN B, NAZER N. Does citation reflect so- 
cial structure? ; Longitudinal evidence from the “Globenet” inter- 
disciplinary research group[ J]. Journal of the Association for Infor- 
mation Science and Technology, 2004, 55(2): 111 - 126. 


[25] YAN E, DING Y. Scholarly network similarities: how bibliograph- 


ra 


ic coupling networks , citation networks, cocitation networks, topi- 
cal networks, coauthorship networks, and coword networks relate to 
each other[ J]. Journal of the Association for Information Science 
and Technology, 2012, 63(7) : 1313 - 1326. 

[26] SNIJDERS T A B, PATTISON P E, ROBINS G L. New specifica- 
tions for exponential random graph models[ J]. Sociological meth- 
odology, 2006, 36(1) : 99 - 153. 

[27] ROBINS G, SNIJDERS T, WANG P. Recent developments in ex- 
ponential random graph (p * ) models for social networks[ J]. So- 
cial networks , 2007, 29(2) : 192 -215. 


[28] THORNE N, AULD D S, INGLESE J. Apparent activity in high- 


mar 


throughput screening: origins of compound -dependent assay inter- 
ference[ J]. Current opinion in chemical biology, 2010, 14 (3): 
315 -324. 

[29] LIM S Y, SUH M. Intellectual property business models using pa- 


85 


国定 情报 三 作 e 


第 63 卷 第 10 期 2019 年 5 月 


tent acquisition; a case study of royalty pharma inc[ J]. Journal of large-scale, chemically annotated patent document database [ J |. 
commercial biotechnology, 2016, 22(2): 6-18. Nucleic acids research, 2016, 44 ( D1); D1220 - D1228. 

[30] WAGNER S, WAKEMAN S. What do patent-based measures tell [36] MARRA M, EMROUZNEJAD A, HO W. The value of indirect ties 
us about product commercialization? evidence from the pharmaceu- in citation networks; SNA analysis with OWA operator weights[ J]. 
tical industry[ J]. Research policy, 2016, 45(5) ; 1091 - 1102. Information sciences, 2015, 314; 135 - 151. 

[31] KISOR D F. Collaboration to meet a therapeutic need ; the develop- [37] LUKE D. A user’s guide to network analysis in R[ M]. Cham; 
ment of nelarabine[ J/OL]. Clinical nedicine. 2009, 1: 1317 - Springer International Publishing, 2015. 
1320. [2018 -12 -06 ]. https://dio. org/10. 4137/CMT. s2909. [38 ] DUBNJAKOVIC A. An evaluation of exponential random graph 

[32] FDA approval for nelarabine [ EB/OL]. [2017 - 12 -06]. ht- modeling and its use in library and information science studies[ J]. 
tps ://www. cancer. gov/ about -cancer/treatment/drugs/ fda -nelara- Library & information science research, 2016 , 38 (3) ; 259 — 264. 
bine. [39] ROBINS G, PATTISON P, WANG P. Closure, connectivity and 

[33] COHEN M H, JOHNSON J R, JUSTICE R. FDA drug approval degree distributions: exponential random graph (p * ) models for 
summary ; nelarabine ( Arranon) for the treatment of T-cell lympho- directed social networks[ J]. Social networks, 2009, 31(2): 105 
blastic leukemia/lymphoma[ J]. The oncologist, 2008, 13 (6): 117, 
709 -714 作者 贡献 说 明 : 

[3 KADIA TM, GANDHI V. Nelarabine in the treatment of pediatric 杨 冠 册 :负责 论文 思路 框架 构建 ,主体 内 容 撰 写 .实验 
„and adult patients with T -cell acute lymphoblastic leukemia and HARAI f; 


‘lymphoma[ J]. Expert review of hematology, 2016, 10 (1); 1- 
L tx 
[ 35.) PAPADATOS G, DAVIES M, DEDMAN N. SureChEMBL: a 


刘 占 麟 :进行 数据 探索 代码 调 优 、 实验 结 果 分 析 ; 
李纲 :确定 论文 思路 ,提供 论文 修改 建议 。 


Understanding Mechanisms of Patent Citation Formation Based on ERGM. 
A Case Study of the Nelarabine Drug 
Yang Guancan Liu Zhanlin’ Li Gang’ 
! School of Information Resource Management of Renmin University of China, Beijing 1000872 
? Department of Industrial and Systems Engineering, University of Washington, Seattle 98105 
a * School of Information Management of Wuhan University, Wuhan 430072 
. 《 Abstract: | Purpose/ significance | The Formation of patent citation is necessary to understand innovation networks. 
The independence assumption set by the Conventional regression model for observed objects cannot integrate the structural 
effect factors of the network into the model to provide comprehensive statistical inference. ERGMs ( exponential random 
graph model) represent a methodological innovation of statistical inference for networks given their ability to model actor 
attributes along with endogenous self -organizational processes and exogenous network covariates. [ Method/process | In 
this paper, ERGMs are applied to systematic inspect the five mechanisms affecting patent citation formation in a sample of 
Nelarabine drug. The five mechanisms contain main effect, difference effect of citation lag, and activity effect, transitivity 
effect and network covariates. [ Result/conclusion | We find that five different types of mechanisms play diverse roles in 
patent citation formation. And three of effects among these mechanisms have significant impacts on citation formation of 
nelarabine drug; network covariates based on shared inventors and shared patent family membership, and transitivity 
effect. In addition, some aided mechanism play a supporting role on patent citation formation, such as difference of time 
lag, main effects of number of claims and reference. 
Keywords: patent citations formation ERG (exponential random graph) nelarabine drug discovery statistical 
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